សិក្ខាសាលា​តាម​អន​ឡាញ​ស្តី​ពី​ការ​ដកស្រង់​ទិន្នន័យ​

​នៅ​ក្នុង​ខែមីនា​ ក្រុមការងារ​ Internews​ បាន​សម្របសម្រួល​សិក្ខាសាលា​ពី​ចំងាយ​មួយ​ស្តី​ពី​ “​ការ​ដកស្រង់​ទិន្នន័យ​ -​ Data​ Scraping”​ សម្រាប់​ក្រុមការងារ​អង្គការ​ទិន្នន័យ​អំពី​ការ​អភិវឌ្ឍ​។​ គោលបំណង​នៃ​សិក្ខាសាលា​នេះ​ គឺ​ដើម្បី​ពង្រឹងសមត្ថភាព​បច្ចេកទេស​របស់​អូ​ឌី​ស៊ីក្នុង​ការ​ប្រមូល​ទិន្នន័យ​ដែល​ទាក់ទង​នឹង​គម្រោង​ ISAC​ ពី​គេហទំព័រ​រដ្ឋាភិបាល​សម្រាប់​ការ​ចែករំលែក​ជា​សាធារណៈ​នៅ​លើ​បណ្តាញ​ទំព័រ​គណនេយ្យ​ភាព​សង្គម​ដែល​កំពុង​អភិវឌ្ឍន៍​។​

​សិក្ខាសាលា​នេះ​ត្រូវ​បាន​ធ្វើ​ឡើង​ដោយ​ក្រុមហ៊ុន​អភិវឌ្ឍន៍​គេហទំព័រ​ Thibi​ ដោយ​ការងារ​របស់​ពួក​គេ​ផ្តោត​លើ​ការងារ​ប្រមូល​ទិន្នន័យ​នៅ​ក្នុង​តំបន់​មេគង្គ​។​ អ្នកចូលរួម​មក​ពី​អូ​ឌី​ស៊ី​មាន​ដូច​ជា​ អ្នកជំនាញ​ស្រាវជ្រាវ​ទិន្នន័យ​ និង​ GIS​ លោក​ ឡុ​ច​ កល្យាណ​ មន្ត្រី​ស្រាវជ្រាវ​ទិន្នន័យ​ជាន់ខ្ពស់​ និង​ GIS​ លោក​ វង្ស​ ពិសិទ្ធ​ មន្ត្រីជាន់ខ្ពស់​ផ្នែក​អភិវឌ្ឍន៍​គេហទំព័រ​ លោក​ សំ​អាន​ ម៉ារ​ឌី​ និង​មន្ត្រី​កម្មវិធី​ និង​ភាព​ជា​ដៃគូ​ កញ្ញា​ អ៊ួ​ន​ វិមល​។

​សិក្ខាសាលា​នេះ​ផ្តោត​ជា​ពិសេស​លើ​បញ្ហា​ប្រឈម​ក្នុង​ការ​ទទួល​បាន​ព័ត៌មាន​ដែល​ម៉ាស៊ីន​អាច​អាន​បាន​ពី​គេហទំព័រ​ដែល​មាន​លក្ខណៈ​ “​ឌីណាមិច​ ឬ​ ថាមវន្ត​”​ ។​ មុន​ពេល​បើក​វគ្គ​សិក្សា​ Thibi​ បាន​ធ្វើការ​ប្រមូល​ទិន្នន័យ​ថវិកា​សាធារណៈ​ និង​បាន​ប្រើប្រាស់​គេហទំព័រ​របស់​រដ្ឋាភិបាល​ និង​គេហទំព័រ​ផ្សេង​ទៀត​របស់​ប្រទេស​កម្ពុជា​ ដើម្បី​ជា​ឧទាហរណ៍​ក្នុង​សិក្ខាសាលា​។​

​សិក្ខាសាលា​នេះ​ត្រូវ​បាន​ធ្វើ​ឡើង​នៅ​ថ្ងៃ​ទី​ ២៩​ និង​ ៣០​ ខែមីនា​ក្នុង​នា​ពេល​រសៀល​ពី​ ២​ ទៅ​ ៣​ ម៉ោង​ ដោយ​បាន​ចែក​ជូន​ដោយ​ក្រុម​ Thibi​ គឺ​ លោក​ Yan​ Naung​ Oak​ តាម​រយៈ​ Zoom​។​ វគ្គ​ទី​ ១​ បាន​ពិនិត្យ​ឡើង​វិញ​នូវ​មូលដ្ឋាន​គ្រឹះ​នៃ​ទំព័រ​បណ្តាញ​ឋិតិ​វន្ត​ (static)​ និង​ថាមវន្ត​ (dynamic)​ និង​វិធី​ផ្សេងៗ​គ្នា​ (​ក្នុង​ទម្រង់​ XML​ /​ CSV​ /​ JSON)​ ដែល​ទិន្នន័យ​ត្រូវ​បាន​បំ​លែង​កូដ​ (encoded)​ និង​ដាក់​ប​ញ្ជូ​ល​ (embedded)​សម្រាប់​ប្រើ​ សម្រាប់​ទំនាក់ទំនង​រវាង​ម៉ាស៊ីន​មេ​ (web​ servers)​ និង​គេហទំព័រ​ (web​ browsers)​។​ សិក្ខាកាម​ក៏​បាន​ធ្វើតេស្ត​បច្ចេកទេស​សម្រាប់​ការ​ដកស្រង់​ទិន្នន័យ​ដោយ​ប្រើ​ Google​ Sheets​ និង​ Workbench​ ផង​ដែរ​។​

​វគ្គ​ទី​ ២​ ផ្តោត​លើ​វិធីសាស្ត្រ​ជឿនលឿន​បន្ថែម​ទៀត​ក្នុង​ការ​ប្រមូល​ទិន្នន័យ​ពី​បណ្តាញ​អ៊ី​ន​ធឺរ​ណែ​ត​៖​ កម្មវិធី​ជំនួយ​ browser​ plug-ins​ និង​កម្មវិធី​អ៊ីនធឺណិត​មួយ​ចំនួន​ទៀត​ (​ឧបករណ៍​ស្តង់ដារ​ឧស្សាហកម្ម​រាប់​បញ្ចូល​ទាំង​ Selector​ Gadget,​ Webscraper,​ HTTPTrack,​ Sitesucker)​។​ ក្រុមការងារ​យើង​ក៏​បាន​បន្ត​ការ​អនុវត្ត​រុករក​ជាក់ស្តែង​នៅ​លើ​គេហទំព័រ​ គ​.​ជ​.​អ​.​ប​ និង​បាន​បញ្ចប់​ដោយ​មាន​អនុសាសន៍​មួយ​ចំនួន​សម្រាប់​ការ​បន្ត​ចូលរួម​របស់​អូ​ឌី​ស៊ី​ជាមួយ​គេហទំព័រ​សាធារណៈ​។

​បន្ទាប់​ពី​សិក្ខាសាលា​នេះ​ក្រុមការងារ​អូ​ឌី​ស៊ី​បាន​ធ្វើ​បច្ចុប្បន្នភាព​សំណុំ​ទិន្នន័យ​ដែល​មាន​ស្រាប់​របស់​ខ្លួន​ស្តី​ពី​ “​របាយការណ៍​ស្តី​ពី​ ចំណូល​ ចំណាយ​ជាក់ស្តែង​របស់​រដ្ឋបាល​ ក្រុង​/​ស្រុក​/​ខណ្ឌ​ ក្នុង​ព្រះរាជាណាចក្រ​កម្ពុជា​ (២០១៥-២០២០)”​ ហើយនឹង​ពិនិត្យ​មើល​ទិន្នន័យ​ថវិកា​ឃុំ​ដើម្បី​ចែករំលែក​ព័ត៌មាន​ថ្មីៗ​ នៅ​ទំព័រ​គណនេយ្យ​ភាព​សង្គម​។​ បន្ថែម​លើ​ការ​តាមដាន​ការ​ប្រើប្រាស់​ឧបករណ៍​ថ្មី​ទាំងនេះ​លទ្ធភាព​នៃ​ឧបករណ៍​ជឿនលឿន​ជាង​មុន​ (​ដូច​ជា​ custom-designed​ scripts)​ នឹង​ត្រូវ​បាន​ស្វែង​យល់​បន្ថែម​ទៀត​ដោយ​ក្រុមការងារ​អូ​ឌី​ស៊ី​។​

​របាយការណ៍​ស្តី​ពី​ ចំណាយ​ជាក់ស្តែង​របស់​រដ្ឋបាល​ ក្រុង​/​ស្រុក​/​ខណ្ឌ​ ក្នុង​ព្រះរាជាណាចក្រ​កម្ពុជា​ (២០១៥-២០២០)

ទិន្នន័យទម្រង់ [CSV]

​របាយការណ៍​ស្តី​ពី​ ចំណូល​​ជាក់ស្តែង​របស់​រដ្ឋបាល​ ក្រុង​/​ស្រុក​/​ខណ្ឌ​ ក្នុង​ព្រះរាជាណាចក្រ​កម្ពុជា​ (២០១៥-២០២០)

ទិន្នន័យទម្រង់ [CSV]